目前,阅读英文对于为数不少的国内“网虫”来说还有着不小的障碍。因此开发网上中文信息资源刻不容缓。
我国于1994年下半年开始发展网络技术。1995年3月,开通了北京、上海两个因特网国际出口。1996年6月骨干网中国网建成后,国内各大中城市的上网户数迅猛增长。根据前不久的统计,全国上网户数已达117.5万。国际上锋头正劲的因特网在中国也被炒得火热,但观者众而真正上网者寥寥。究其原因,因特网上中文信息资源不够丰富恐怕是主要原因。由于我国网络业尚处于起步阶段,加上严重的语言障碍,大多数用户只利用了因特网的通信功能,而尚未真正开发利用因特网上的资源。迄今为止,国内虽已有了相当多的上网接入服务公司(ISP),但由于它们自身的局限,对网上中文信息资源的开发十分有限。真正出色的内容服务(ICP)更是凤毛麟角。
起源于美国的因特网,其中的英文信息资源占据了90%,网上中文信息资源很少,不仅严重影响了我国知识创新体系的发展,也面临着西方信息和文化侵蚀的威胁。大力发展网上中文信息资源的建设不仅关系到民族信息产业发展和以资源为核心的中国信息化进程,而且关系到中国知识经济的形成。在市场经济和网络经济并行的条件下,网络信息资源建设也必须改变传统格局,按照企业化运作机制,建立适合中国具体国情的信息产业发展模式。
中国信息科技研究所、万方网络信息中心主任乔晓东说,众所周知,因特网早在1969年就已诞生,而我国则只是在1995年才掀起一个因特网热潮。这长达20多年的跨距导致我国几乎没有比较成熟和完备的市场培育过程,使得国人对因特网缺乏必要的了解,互联网的业务和信息是有价值的资源这些概念以及共享信息意识在我们的用户当中也相对淡漠。从国际发展的现状来看,因特网已经成为一种新媒体。国内信息资源建设的呼声一天比一天响,信息资源服务的数量也一天比一天多。网上中文信息资源的建设也被提上了日程。
我国信息服务业目前的最大不足是不能向用户提供及时、准确和有效的信息服务。在网络服务已成为信息服务最主要方式的今天,我国互联网上的信息服务却难如人意,据了解,现在网上中文信息的匮乏和陈旧已经到了相当严重的程度。而这造成的直接后果是,网民们在网上很难得到所需的信息。
开发网上中文资源是一个投入大、收益慢、周期长的工程。加之国内上网人士信息交流、共享意识不强,信息服务市场还处在培育阶段,使得网上中文信息资源的开发面临着严峻的挑战。这位主任还说,长期以来,由于主观认识上的局限和客观上信息资源建设投资大、见效慢等原因,在信息建设特别是地方信息建设中,存在着重视信息通信设施建设,忽视信息资源建设的现象。大家都一窝蜂地去建网络,却没人愿去做基础性的资源开发工作,技术性投入相当低,从而形成所谓的“死站点”。同时,国家对二者的投入严重失调,其比例为9比1,与发达国家恰恰相反。
中国科学院网络计算机中心副主任李俊认为,从总体上来说,开发中文信息资源的技术难度不是阻碍其发展的主要因素,网上的中文信息数量并不少,但比较粗糙,现在最需要的是对信息资源进行搜集、整理、加工和分析,以满足多层次、多范围网民的需求,突出信息的实用性。
我国的数据库数量是世界总数的1/10,容量却是世界总量的1/100,产值仅为1/1000,落后世界水平20—30年。目前,全国1000多个数据库中,小库多,死库多,且商业化程度很低,为社会进行商业化服务的公用数据库少得可怜。那么如何来开发网上中文信息资源呢?万方数据提出了开辟网上中文信息资源建设的新途径:第一,强化数据库建设,形成网上信息资源规模。网上信息资源建设应该以数据库为中心展开,边建设投入,边利用产出,在滚动发展中不断丰富壮大。数据库的经营讲究规模效应,国家应将本来有限的资金集中投入,发展数据库,壮大网上中文信息资源。第二,联手合作,利益共享,建立全文数据库。尊重信息源的知识产权,解决好和相关合作单位的利益分配问题,形成互惠互利的良好合作机制。我国信息资源的电子化率比较低,尚不到10%,在重视转换利用好现阶段正在形成的排版数据的同时,应结合具体的数据库内容和建设情况,以形成完整系列的信息内容,实现文摘型数据库和全文数据库建设的同步,实现传统媒体和网络媒体的统一。第三,促宣传,创品牌,大力发展信息增值服务功能。加强信息资源开放意识和应用技能的宣传,大力发展与网上信息提供相对应的咨询服务、中介活动和专题信息服务,培育信息资源服务的新生长点,导入信息服务企业形象,创立真正有实力、有影响的信息服务品牌。总之,只有针对不同行业提供有特色和风格的中文信息,才能推进民族信息产业的发展,抗拒国外信息公司的入侵,最终获得中国用户的喜爱和支持。